457 research outputs found

    Parallelization of the ADI method exploring vector computing in GPUs

    Get PDF
    Dissertação de mestrado integrado em Engenharia InformáticaThe 2D convection-diffusion is a well-known problem in scientific simulation that often uses a direct method to solve a system of N linear equations, which requires N3 operations. This problem can be solved using a more efficient computational method, known as the alternating direction implicit (ADI). It solves a system of N linear equations in 2N times with N operations each, implemented in two steps, one to solve row by row, the other column by column. Each N operation is fully independent in each step, which opens an opportunity to an embarrassingly parallel solution. This method also explores the way matrices are stored in computer memory, either in row-major or column-major, by splitting each iteration in two. The major bottleneck of this method is solving the system of linear equations. These systems of linear equations can be described as tridiagonal matrices since the elements are always stored on the three main diagonals of the matrices. Algorithms tailored for tridiagonal matrices, can significantly improve the performance. These can be sequential (i.e. the Thomas algorithm) or parallel (i.e. the cyclic reduction CR, and the parallel cyclic reduction PCR). Current vector extensions in conventional scalar processing units, such as x86-64 and ARM devices, require the vector elements to be in contiguous memory locations to avoid performance penalties. To overcome these limitations in dot products several approaches are proposed and evaluated in this work, both in general-purpose processing units and in specific accelerators, namely NVidia GPUs. Profiling the code execution on a server based on x86-64 devices showed that the ADI method needs a combination of CPU computation power and memory transfer speed. This is best showed on a server based on the Intel manycore device, KNL, where the algorithm scales until the memory bandwidth is no longer enough to feed all 64 computing cores. A dual-socket server based on 16-core Xeon Skylakes, with AVX-512 vector support, proved to be a better choice: the algorithm executes in less time and scales better. The introduction of GPU computing to further improve the execution performance (and also using other optimisation techniques, namely a different thread scheme and shared memory to speed up the process) showed better results for larger grid sizes (above 32Ki x 32Ki). The CUDA development environment also showed a better performance than using OpenCL, in most cases. The largest difference was using a hybrid CR-PCR, where the OpenCL code displayed a major performance improvement when compared to CUDA. But even with this speedup, the better average time for the ADI method on all tested configurations on a NVidia GPU was using CUDA on an available updated GPU (with a Pascal architecture) and the CR as the auxiliary method.O problema da convecção-difusão é utilizado em simulaçãos cientificas que regularmente utilizam métodos diretos para solucionar um sistema de N equações lineares e necessitam de N3 operações. O problema pode ser resolvido utilizando um método computacionalmente mais eficiente para resolver um sistema de N equações lineares com N operações cada, implementado em dois passos, um solucionando linha a linha e outro solucionando coluna a coluna. Cada par de N operações são independentes em cada passo, havendo assim uma oportunidade de utilizar uma solução em baraçosamente paralela. Este método também explora o modo de guardar as matrizes na memória do computados, sendo esta por linhas ou em colunas, dividindo cada iteração em duas, este método é conhecido como o método de direção alternada. O maior bottleneck deste problema é a resolução dos sistemas de equações lineares criados pelo ADI. Estes sistemas podem ser descritos como matrizes tridiagonais, visto todos os seus elementos se encontrarem nas 3 diagonais interiores e a utilização de métodos estudados para este caso é necessário para conseguir atingir a melhor performance possível. Esses métodos podem ser sequenciais (como o algoritmo de Thomas) ou paralelos (como o CR e o PCR) As extensões vectoriais utilizadas nas atuais unidades de processamento, como dispositivos x86-64 e ARM, necessitam que os elementos do vetor estejam em blocos de memória contíguos para não sofrer penalizações. Algumas abordagens foram estudadas neste trabalho para as ultrapassar, tanto em processadores convencionais como em aceleradores de computação. Os registos do tempo em servidores baseado em dispositivos x86-64 mostram que o ADI necessitam de uma combinação de poder de processamento assim como velocidade de transferência de dados. Isto é demonstrado especialmente no servidor baseado no dispositivo KNL da Intel, no qual o algoritmo escala até que a largura de banda deixe de ser suficiente para o problema. Um servidor com dois sockets em que cada é composto por um dispositivo com 16 cores baseado na arquitetura Xeon Skylake, com acesso ao AVX-512, mostrou ser a melhor escolha: o algoritmo faz as mesmas operações em menos tempo e escala melhor. Com a introdução de computação com GPUs para melhorar a performance do programa mostrou melhores resultados para problemas de maiores dimensões (tamanho acima de 32Ki x 32Ki celulas). O desenvolvimento em CUDA também mostrou melhores resultados que em OpenCL na maioria dos casos. A maior divergência foi observada ao utilizar o método CR-PCR, onde o OpenCL mostrou melhor performance que em CUDA. Mas mesmo com este método sendo mais eficaz que o mesmo em CUDA, o melhor performance com o método ADI foi observado utilizando CUDA no GPU mais recente estudado com o método CR

    Innovation, creativity and new product development: a human central design case study

    Get PDF
    Innovation as been changing through the years and companies are continuously seeking for enhanced processes to achieve competitive advantage. Innovation is now seen as an open and collaborative process with the entering of different players in the ecosystem. Universities are relevant candidates to change innovation landscape and contribute to the reality of a learning economy. The present work explores a university-industry collaboration based on a case study of an innovation project under the ME310 program. Porto Design Factory (P.Porto) and IKEA Industry joined forces to tackle a problem using the Human-Centred Design (HCD) approach. The case study methodology provides an understanding the outcomes that revealed the potential of the HCD to solve a technical problem while enhancing the customer experience. Also, it’s possible to recognize the benefits that each institution had by collaborating. Research, prototypes and comprehensive documentation with all the knowledge generated through the process, were some of the results that contributed to the company’s innovation effort. PDF also benefited by providing differentiating learning conditions and employment opportunities to its students. The outcomes show that companies do benefit from building interfaces with external partners and that universities are relevant players in the innovation ecosystem satisfying its third mission. Further investigation may look for the level of implementation of the concepts coming from this kind of partnerships as well as it impacts in company’s culture and work process in the long term

    Gymnotus interruptus, a new species of electric fish from the Rio de Contas basin, Bahia, Brazil (Teleostei: Gymnotiformes: Gymnotidae)

    Get PDF
    > Abstract A new species of Gymnotus Linnaeus is described from Riacho Cambiriba a clear water stream, tributary of the Rio de Contas basin, Bahia, northeastern Brazil. The new species is a member of the G. carapo species-group, which is characterized by the presence of a transparent patch near the posterior end of the anal fin and two (vs. one) laterosensory pores in the dorso-posterior region of the preopercle bone. Gymnotus interruptus may be diagnosed by a unique combination of morphometric and meristic characters: wider interorbital distance (44.6 -45.9% of STO); 9 scales above lateral line at midbody; 23 -28 ventrally oriented lateral line rami; 37 -40 pored lateral line scales to first ventral ramus of lateral line; shorter snout (29.6 -30.5% of STO). Gymnotus interruptus, the first record of a gymnotiform fish from the rio de Contas basin, may be easily distinguished from G. carapo or G. bahianus, two congeners also occurring in northeastern Brazil, by its colour pattern, in which the pale interbands, anterior to vertical through first ventral lateral line ramus, are ventrally and/or dorsally fragmented, allowing union of adjacent dark bands. > Resumo Uma nova espécie de Gymnotus Linnaeus é descrita para o Riacho Cambiriba, um corpo de água clara, tributário da bacia do Rio de Contas, Bahia, nordeste do Brasil. A nova espécie é um membro do grupo de espécies G. carapo, caracterizado pela presença de uma mancha clara próxima a ponta posterior da nadadeira anal e dois (vs. um) poros latero-sensoriais na porção dorso-posterior do preopéculo. Gymnotus. interruptus é diagnosticada através de dados morfométricos e merísticos, de onde é obtida a seguinte exclusiva combinação de caracteres: maior distância inter-orbital (44.6 -45.9% do comprimento Focinho-opérculo); nove escamas acima da linha lateral na região mediana do corpo; nadadeira peitoral com 17 raios; 23 -28 ramos da linha lateral ventralmente orientados; 37 -40 escamas perfuradas na linha lateral anterior ao primeiro ramo ventralmente orientado. Gymnotus interruptus é mais suscetível a ser erroneamente identificado como G. carapo ou G. bahianus, porém esta espécie pode ser diferenciada de seus semelhantes através de seu único padrão de colorido onde as interbandas claras, anteriores ao primeiro ramo ventralmente orientado da linha lateral, são fragmentadas dorsalmente e/ou ventralmente, permitindo a união das bandas escuras adjacentes. &gt

    Consulting project for Banco Invest: development of internal rating model - limitations of the report and recommendations for the bank

    Get PDF
    The group work to which this individual reports hould be attached does not mention certain characteristics of the data that could be used for other research papers and for the bank. As such, this individual work develops the topics of limitations of the database used, the limitations of the type of work done in the Portuguese market, key characteristics of the variables used, and recommendations to the bank on further improvement of the model used and ,from the perspective of a consultant, on what the bank could improve internally

    Shedding light on miRNA targeting through structure

    Get PDF
    In miRNAs, it is known that seed pairing is an important parameter for targeting, but there are still missing links on why it targets a certain mRNA and how the decision between degradation or translation repression is made. In our work, we use liquid state NMR spectroscopy, EMSA and UV melting experiments to biophysically characterise the complex of miRNA-34a with the target mRNA of CD44 and PNUTS. Here we present the NMR sample preparation as well as the first steps for the biophysical description of the mRNA.miRNA complexes. Our EMSA data suggests both miRNA.mRNA complexes are transient and miRNA.gCD44 possibility has a higher Kd then miRNA.PNUTS. Through NMR miRNA.PNUTS complex was deemed more structurally dynamic, yet interestingly with UV melting it had a higher Tm then miRNA.gCD44 complex. Finally, we also performed several simulations on several different mRNA targets with MCFold unveiling a kink on the mRNA as a structural trend which could be a necessity for docking of the duplex into Ago. Still further studies must be conducted in order to solve the structures of both duplexes in study and a bigger population of simulated structures must be collected

    Uma adaptação do modelo de resposta ao item para mensuração de heterogeneidade atribuída à fonte desconhecida

    Get PDF
    Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2012.A Teoria de Resposta ao Item (TRI) caracteriza-se por ser um conjunto de modelos matemáticos cujo propósito é modelar a probabilidade de uma resposta de um item j por um indíviduo i em função de parâmetros associados ao item e de traços latentes associados ao indivíduo. No entanto, outros fatores externos e desconhecidos podem influenciar esta probabilidade de acerto, causando heterogeneidade nos dados (superdispersão), muitas vezes não ajustada pelos modelos de resposta ao item. Por outro lado, Molenberghs, Verbeke, Demétrio e Vieira (2010) descreveram alguns modelos no campo dos Modelos Lineares Generalizados Mistos (MLGM) para tratar dados binários longitudinais com superdispersão. Tais modelos que conseguem capturar este efeito acrescentando um efeito aleatório com distribuição conjugada que, desta forma, captura esta heterogeneidade atribuída á fonte desconhecida. O modelo de resposta ao item de Rasch foi reescrito de forma que ele pudesse ser tratado como membro da família dos MLGM e um novo modelo que capture a superdispersão dos dados foi proposto e definido. Além disso, utilizando resultados analíticos apresentados por Molenberghs et al. (2010), definiu-se o modelo de Rasch estendido analítico (REMol), sendo este uma simpliçação do modelo de Rasch estendido com ligação probit. Por fim, os modelos propostos e o modelo de Rasch tradicional são aplicados a dados da Prova Brasil 2007. Os resultados demonstram que os ajustes dos modelos são similares, exceto o modelo REMol, que gerou estimativas e erros padrões distintos, indicando que capturou uma maior variabilidade dos dados, cumprindo a proposta inicial do modelo.The Item Response Theory (IRT) is characterized as a set of mathematical models whose purpose is _t the probability of some response of the i-th subject to respond correctly the j-th item in function of the items' parameters and ability's subject. However, others external and unknown factors may inuence this probability causing heterogeneity (overdispersion) in the data, oftentimes not _tted by the item response models. On the other hand, Molenberghs, Verbeke, Dem_etrio e Vieira (2010) described some models in the _eld Generalized Linear Mixed Models (GLMM) to treat binary longitudinal data with overdispersion. Such models capture this e_ects by adding an random parameters with conjugated distribution that, this way, it capture this heterogeneity from unknown source. The Rasch model was rewritten so that it belongs to GLMM's family and a new model that capture the overdispersion from the data was proposed. Furthermore, using the analytical results shown by Molenberghs et al.(2010), it was de_ne the analytical extended Rasch model (REMol), being this a simpli_cation to extended Rasch model with probit link function. Finally, the proposed models and traditional Rasch model was applied to data from Prova Brasil 2007. The results show that the _ts of the models are similar, except the REMol model. This model found distinct estimates and standard errors adjusted to the greater variability from the data, ful_lling the initial proposal of the model

    On Perceiving

    Get PDF
    This text provides an overview of medieval accounts of perceptio
    corecore